- 双语例句 更多例句
针对强化学习算法的状态值泛化和随机探索策略在确定性MDP系统控制中存在着学习效率低的问题,本文提出基于模型的层次化强化学习算法。
互联网摘选
分别针对离散化的状态空间和连续状态空间的压缩问题,提出了基于信息熵的强化学习算法和基于自主生成神经网络函数逼近器的强化学习算法。
互联网摘选
应用多代理马尔可夫决策过程,建立了一种新的多管理者网络故障监控机制,并给出了该机制下基于强化学习的轮询策略。
互联网摘选
Comparative Analysis of Single-Agent Reinforcement Learning and Multi-Agent Reinforcement Learning
单agent强化学习与多agent强化学习比较研究
互联网摘选
The Study of Multi-Agent Reinforcement Learning Methods for Cooperative Team
多Agent协作团队的强化学习方法研究
互联网摘选
针对月球车运动控制中的多轮协调问题,提出了一种基于混合策略梯度增强学习的自适应控制方法。
互联网摘选
传统的强化学习算法应用到大状态、动作空间和任务复杂的马尔可夫决策过程问题时,存在收敛速度慢,训练时间长等问题。
互联网摘选
A Multi-agent Cooperative Reinforcement Learning Algorithm Based on Team Markov Game
一种基于团队马尔可夫博弈的多agent协同强化学习算法
互联网摘选
分析了折扣激励学习存在的问题,对MDPs的SARSA(λ)算法进行了折扣的比较实验分析,讨论了平均奖赏常量对无折扣SARSA(()算法的影响。
互联网摘选
分层强化学习(HRL)是为解决强化学习的维数灾问题而提出的,并取得了显著进展。
互联网摘选
本文的创新点和研究成果主要包括:1、在策略梯度增强学习理论框架的研究中,证明了现有策略梯度增强学习算法的梯度估计公式都符合统一的形式。
互联网摘选
On-Policy Modeless Reinforcement Learning Algorithms for Average-Payoff MDPs
平均奖赏MDP的在策略无模型激励学习算法
互联网摘选
S(λ): A reinforcement learning algorithm based on average-payoff MDPs
S(λ):一个基于平均奖赏MDPs的激励学习算法
互联网摘选
提出了一种基于分布式强化学习的多Agent协调模型并给出了相应的算法。
互联网摘选
Agent reinforcement learning is an important branch of machine learning.
Agent强化学习是机器学习的一个重要分支。
互联网摘选
The concepts of Markov decision process and reinforcement learning are introduced firstly.
论文首先介绍了马尔可夫决策过程的基本概念和再励学习的框架。
互联网摘选
基于强化学习原理提出了整体与局部混合防御模型,通过智能体之间的角色转换提高防守能力,与传统相比更有优势。
互联网摘选
基于多Agent强化学习的战时备件供应保障动态协调机制
互联网摘选
The coordination behavior level used reinforcement learning to strengthen the robots' intelligence.
协调行为层应用强化学习法增强了机器人群体的智能性;
互联网摘选
本文分析了几种强化学习方法,包括基于值函数(Value-Based)近似方法、策略梯度方法(Policy gradient)、以及Actor-Critic方法等。
互联网摘选
Application and development of reinforcement learning theory in power systems
强化学习理论在电力系统中的应用及展望
互联网摘选
本文分别针对具有离散行为空间和连续行为空间的马氏决策问题,提出了两种模糊策略梯度增强学习方法(Fuzzy Policy Gradient:FPG)。
互联网摘选
针对这种导师信号难以获取、模糊规则难以制定的复杂优化控制问题,本文提出了一种基于混合式策略梯度增强学习PG-SVM的多轮协调控制方法。
互联网摘选
Research and Application on Reinforcement Learning and Communication Technology in Agent
Agent的强化学习与通信技术研究及应用
互联网摘选
- 相关词组
- distance learning远程教育;
- learning organization学习型组织;
- rote learning机械学习;
- book learningn.书本知识;墨水;
- binding reinforcement结合钢筋;
- Learning Capacity学习能力;学习力
- Power Learning学习力
- Learning is more precious than gold一字千金
- The Great Learning大学;
- Revival of Learning文艺复兴;学习的复兴
- Mobile Learning移动学习;行动学习
- Supervised Learning有监督的学习;
- adventure learning探险学习法;
- Learning is an endless process学无止境
- The Learning Society学习的社会;学习型社会;学习化社会;学习社会
- institutions of higher learning高等院校;
- anchorage of reinforcement钢筋锚具;
- Deep Learning深度学习;
- learning curvesn.学习曲线( learning curve的名词复数 );
- Exploration Learning探究式学习
- 今日热词
- 热门搜索
- u n. 英语字母表的第21个字母;abbr. U类影片(适合所有观众)
- remotion n.移动,移居;
- simplify v.使简化;
- ski n.滑雪;滑雪板;滑水橇;滑行装置;v.滑雪,滑冰;
- due adj.预期的;到期的;适当的;应有的;n.应得的东西;
- everything pron.每件事,一切;形势;最重要的东西;所有事物;事事;每件事物;万事
- if you come to me 如果你来到我身边; 如果你来找我;原子少女猫;
- Hannah Montana 孟汉娜;汉娜·蒙塔娜;汉娜蒙塔娜;乖乖女是大明星
- support v.支持;帮助,资助;养活,维持;支撑;证实;n.支持;帮助;支撑(物);证据;
- cook v.烹饪,煮,烧;n.厨师;做饭的人;
- soul n. 灵魂;人;心灵;内心;灵乐,灵歌;典范;心性;(人类整体的)精神状况,道德品质;真挚情感;某种人adj. 美国黑人文化的;黑人控制的
- ink n.墨水,油墨;(乌贼分泌的)墨液;vt.给…上油墨(以供印刷、签订合同等);签名(在…上);涂油墨;